🥑OBJETIVO: EVALUAR SI HAY ASOCIACION:

Note
Important
  • ¿QUE ES ENTIENDE POR ASOCIACION?

  • Es una agrupacion definida por el usuario de grupos y elementos relacionados.

  • Puede constar de uno o varios grupos junto con algunos o todos los elementos de estos grupos.

BD

Note
Important
  • Vamos a Importar la base de datos ya asignado anteriormente.

  • Categorizamos o agrupamos por valores que se le asignara para cada variable.

library(readxl)
Caso_Aguacate_xls<-read_excel("avocado.csv..xlsx")

library(epiDisplay)
Caso_Aguacate_xls$cat_Aguacate <- ifelse(Caso_Aguacate_xls$`AveragePrice       (PRECIO PROMEDIO)` <= 1 , 'promedio-','promedio+')

Caso_Aguacate_xls$cat_numero_total_vendido <- ifelse(Caso_Aguacate_xls$`Total Volume      (NUMERO TOTAL DE AGUACATES VENDIDOS)` <= 850644 , 'ventas menores','ventas mayores')

Caso_Aguacate_xls$cat_numero_4046_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4046-PEQUEÑO VENDIDOS` <= 293008 , 'ventas menores de 4046','ventas mayores de 4046')

Caso_Aguacate_xls$cat_numero_4225_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4225-LARGO VENDIDOS` <= 295154 , 'ventas menores de 4225','ventas mayores de 4225')

Caso_Aguacate_xls$cat_numero_4770_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4770-GRANDE VENDIDOS` <= 22839 , 'ventas menores de 4770','ventas mayores de 4770')

Caso_Aguacate_xls$bolsas_totales <- ifelse(Caso_Aguacate_xls$`Total Bags  (BOLSAS TOTALES)` <= 239639 , 'bolsas totales  menores','bolsas totales mayores')

Caso_Aguacate_xls$bolsas_pequeñas <- ifelse(Caso_Aguacate_xls$`Small Bags (BOLSAS PEQUEÑAS)` <= 182194 , 'bolsas pequeñas  menores','bolsas pequeñas mayores')

Caso_Aguacate_xls$bolsas_grandes <- ifelse(Caso_Aguacate_xls$`Large Bags  (BOLSAS GRANDES)` <= 54338 , 'bolsas grandes  menores','bolsas grandes mayores')

Caso_Aguacate_xls$bolsas_extragrandes <- ifelse(Caso_Aguacate_xls$`XLarge Bags (BOLSAS EXTRAGRANDES)` <= 3106 , 'bolsas extragrandes  menores','bolsas extragrandes mayores')

🥑DETERMINAR SI HAY ASOCIACION ENTRE EL NUMERO DE AGUACATE DE NUMERO 4046 Y LAS BOLSAS TOTALES

table(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales)
                        
                         bolsas totales  menores bolsas totales mayores
  ventas mayores de 4046                     599                   1865
  ventas menores de 4046                   14970                    815
Note
Important
  • Como podemos visualizar que en las ventas mayores que se realizo para tipo 4046 se obtuvo 599 bolsas totales y fueron menores y 1865 fueron bolsas totales mayores.
  • En cambio en las ventas menores que se realizo para tipo 4046 se obtuvo 14970 bolsas totales y fueron menores y 815 fueron bolsas totales mayores.

📊TABLAS DE CONTINGENCIA:📊

📈OBTENER LAS PROPORCIONES DE LA TIPO CON REGION

library(gmodels)
   
    CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=F, prop.chisp=F)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|-------------------------|

 
Total Observations in Table:  18249 

 
                                          | Caso_Aguacate_xls$bolsas_totales 
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales  menores |  bolsas totales mayores |               Row Total | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas mayores de 4046 |                     599 |                    1865 |                    2464 | 
                                          |                1074.827 |                6244.022 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas menores de 4046 |                   14970 |                     815 |                   15785 | 
                                          |                 167.778 |                 974.677 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                             Column Total |                   15569 |                    2680 |                   18249 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|

 

📈OBTENER LAS PROPORCIONES RESPECTO AL TOTAL

CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=T, prop.chisp=F)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  18249 

 
                                          | Caso_Aguacate_xls$bolsas_totales 
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales  menores |  bolsas totales mayores |               Row Total | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas mayores de 4046 |                     599 |                    1865 |                    2464 | 
                                          |                1074.827 |                6244.022 |                         | 
                                          |                   0.033 |                   0.102 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas menores de 4046 |                   14970 |                     815 |                   15785 | 
                                          |                 167.778 |                 974.677 |                         | 
                                          |                   0.820 |                   0.045 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                             Column Total |                   15569 |                    2680 |                   18249 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|

 

📈OBTENER LAS PROPOCIONES (PORCENTAJES() POR FILAS

    CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=T, prop.c=F, prop.t=F, prop.chisp=F)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|           N / Row Total |
|-------------------------|

 
Total Observations in Table:  18249 

 
                                          | Caso_Aguacate_xls$bolsas_totales 
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales  menores |  bolsas totales mayores |               Row Total | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas mayores de 4046 |                     599 |                    1865 |                    2464 | 
                                          |                1074.827 |                6244.022 |                         | 
                                          |                   0.243 |                   0.757 |                   0.135 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas menores de 4046 |                   14970 |                     815 |                   15785 | 
                                          |                 167.778 |                 974.677 |                         | 
                                          |                   0.948 |                   0.052 |                   0.865 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                             Column Total |                   15569 |                    2680 |                   18249 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|

 

📈OBTENER LAS PROPOCIONES (PORCENTAJES() POR COLUMNAS

    CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=T, prop.t=F, prop.chisp=F)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|           N / Col Total |
|-------------------------|

 
Total Observations in Table:  18249 

 
                                          | Caso_Aguacate_xls$bolsas_totales 
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales  menores |  bolsas totales mayores |               Row Total | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas mayores de 4046 |                     599 |                    1865 |                    2464 | 
                                          |                1074.827 |                6244.022 |                         | 
                                          |                   0.038 |                   0.696 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas menores de 4046 |                   14970 |                     815 |                   15785 | 
                                          |                 167.778 |                 974.677 |                         | 
                                          |                   0.962 |                   0.304 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                             Column Total |                   15569 |                    2680 |                   18249 | 
                                          |                   0.853 |                   0.147 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|

 

🥑GRAFICA DE NUMERO TOTAL CON NUMERO 4046 CON LAS BOLSAS TOTALES

library(ggplot2)

Attaching package: 'ggplot2'
The following object is masked from 'package:epiDisplay':

    alpha
    ggplot(data=Caso_Aguacate_xls, aes(x=cat_numero_4046_vendido, fill=bolsas_totales))+geom_bar(position = "dodge")

🥑PRUEBA DE INDEPENDENCIA

FRECUENCIAS ESPERADAS

  CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=F, prop.chisp=T)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|-------------------------|

 
Total Observations in Table:  18249 

 
                                          | Caso_Aguacate_xls$bolsas_totales 
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales  menores |  bolsas totales mayores |               Row Total | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas mayores de 4046 |                     599 |                    1865 |                    2464 | 
                                          |                1074.827 |                6244.022 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                   ventas menores de 4046 |                   14970 |                     815 |                   15785 | 
                                          |                 167.778 |                 974.677 |                         | 
------------------------------------------|-------------------------|-------------------------|-------------------------|
                             Column Total |                   15569 |                    2680 |                   18249 | 
------------------------------------------|-------------------------|-------------------------|-------------------------|

 
#H1: LA VENTA DE AGUACATE CON NUMERO 4046 SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS
#H0: LA VENTA DE AGUACATE CON NUMERO 4046 NO SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS

PRUEBA ESTADISTICA…………………..

    library(tigerstats)
    chisqtestGC(~cat_numero_4046_vendido+bolsas_totales, data = Caso_Aguacate_xls )
Pearson's Chi-squared test with Yates' continuity correction 

Observed Counts:
                        bolsas_totales
cat_numero_4046_vendido  bolsas totales  menores bolsas totales mayores
  ventas mayores de 4046                     599                   1865
  ventas menores de 4046                   14970                    815

Counts Expected by Null:
                        bolsas_totales
cat_numero_4046_vendido  bolsas totales  menores bolsas totales mayores
  ventas mayores de 4046                 2102.14                 361.86
  ventas menores de 4046                13466.86                2318.14

Contributions to the chi-square statistic:
                        bolsas_totales
cat_numero_4046_vendido  bolsas totales  menores bolsas totales mayores
  ventas mayores de 4046                 1074.83                6244.02
  ventas menores de 4046                  167.78                 974.68


Chi-Square Statistic = 8455.675 
Degrees of Freedom of the table = 1 
P-Value = 0 
#Chi-Square Statistic = 8455.675 
#Degrees of Freedom of the table = 1 
#P-Value = 0  < 0.05 entonces podemos afirmar que  se rechaza H0 , existe una asociacion entre ambas variables 

📊PASOS PARA MEJORAR GRAFICO DE PRECIOS PROMEDIO DE AGUACATE

library(ggplot2)
    # gráfica con ggplot2
    ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
      geom_bar()

📊Mejorando el gráfico

ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
      geom_bar()+
      xlab("PRECIO PROMEDIO")+
      ylab("N° DE  AGUACATE")+
      ggtitle("Distribución de precio de aguacate")

📊Mejorando el gráfico 2

grafico1<-ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
      geom_bar(fill="red", width = 0.5)+
      xlab("PRECIO PROMEDIO")+
      ylab("N° DE  AGUACATE")+
      ggtitle("Distribución de precio de aguacate")
grafico1+theme_dark()